МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)
Общая модель эксплуатации
Постановка задачи. Процесс эксплуатации комплексов оборудования управляем. Пусть X(t) есть векторный случайный процесс изменения параметров (нрелполагается, что выбор параметров осуществлен по некоторому приемлемому критерию) комплексов с учетом регулировок параметров в процессе эксплуатации (регулировки могут быть плановыми и неплановыми — при отказах комплекса). В процессе эксплуатации обслуживающий персонал (а в случае само — <>|Н аиизующегося комплекса — кибернетическое устройство) вырабатывает и реализует некоторую стратегию эксплуатации комплексов, оависящую от протії. і значений процесса X(t) и от принятых в прошлом решений в связи с ре — I лнровками параметров (замену системы или блоков, входящих в состав комплекса, будем рассматривать как частный случай регулировок). Так как в промессе эксплуатации параметры комплексов, как правило, измеряются в дискретные моменты времени, будем считать, что (єГ принимает значения 0, 1,2,…
Обозначим через flj векторную случайную функцию — процесс изменения параметров комплекса без учета регулировок, а через Ct—некоторую векторне ні управляющую функцию. По определению вероятностные распределения at (вес возможные значения этого процесса обозначим через А) не зависят от управления (в том числе и скачкообразные изменения процесса at пли его сос — I а паяющих). Будем предполагать; что эти распределения неизвестны, а следо — нагельно, остаются неизвестными также и свойства пространства А’°(А'(/)єА°), ілк как в эксплуатацию поступила новая система.
Управляющая функция С(єС (С— пространство всех. возможных ее значения) должна зависеть от всех прошлых значений процесса Xt. Физический смысл этой функции поясним ниже.
На основании вышеизложенного можно записать, следуя Ю. Гренанде — ру 183]; X(t)=D(at, t, Ct). Функция D, описывающая динамику изменения параметров комплекса в процессе эксплуатации, символически может быть записана таким образом: Л XТXС->-Х. При этом предполагаем, что А, С, X являются конечными измеряемыми евклидовыми пространствами.
Введем понятие стратегии управления. Известно, что в моменты t—О, 1, наблюдается векторный процесс X(t) и управляющая функция С( зависит пі Х. х2,..х(_1 и от Сл, С2,…, С|_і. Обозначим систему управляющих функции Сі, С2,…, Ct через Gt:
С і = const;
![]() |
![]() |
![]() |
С2 = C’2(-c1);
Cf = Ct (-*д. х2,. • ■, Xf—i).
Систему управляющих функций (1.1) будем называть стратегией управления.
В процессе эксплуатации может встретиться и такой — случай, когда наблюдается не процесс X(t), а некоторый процесс y(t) (например, если учитывать — іііиіики измерения процесса X(t)), связанный оператором Q с процессом X(t):
У і = Qxf, і = ІТТ.
![]() |
С = const;
С2 = С2 (Qxty,
Сз — С3 (Qxi, Qx2);
Cj — С/ (Q. xy, Qx2,…, Qxt—i).
Типичной в практике эксплуатации комплексов оборудования является ситуация, когда только некоторые координаты вектора X (І) доступны наблюдению (выбор контролируемых параметров не обеспечивает наблюдения за всеми составляющими вектора X(/), или другой пример — наблюдение сигнала на фоне аддитивного шума е(: yt=Xt+Bt, в этом случае et не может наблюдаться отдельно).
Стратегии, которые будут рассмотрены ниже, назовем физически реализуемыми или допустимыми.
В процессе эксплуатации комплекса обслуживающий персонал стремится выбрать такую стратегию управления техническим состоянием комплекса (т. е. некоторым случайным процессом at), которая бы при сохранении заданного качества подготовки комплекса к работе обеспечила минимум затрат, связанных с обслуживанием комплекса. Под затратами будем понимать стоимость обслуживания комплекса или время на его обслуживание.
Рассмотрим эксплуатацию комплекса на конечном отрезке времени Т=
={1, 2…….. N] и ‘введем критерии Уі и Уг затрат на эксплуатацию комплекса,.
которые определим формулами:
N
Vi^YUX. Gn)^ 2Ф(*<):
/=1
N
У2= y2(X, gn)= ct),
t=1
где ф— заданная функция затрат, которая определяется из опыта эксплуатации" комплексов аналогичного назначения и уточняется затем применительно к* чг-следуемому комплексу.
Для критерия (‘l,.-2i) в аддитивном случае
С/)=Ф№) + Ф(С/).
Следует отметить, что рассматриваемые стратегии управления предназначаются для удержания векторного процесса at в пределах заданных допусков — на составляющие этого процесса. .Поэтому стратегия управления, — выбираемая из условия минимума затрат, оказывается весьма эффективной по критерию — среднего времени удержания процесса at в заданных пределах.
Остановимся на одном из главных определений — на понятии адаптивного управления применительно к исследуемому процессу эксплуатации комплекса оборудования. Известно, что в процессе эксплуатации комплексов происходит достаточно большое число отказов, которые классифицируются как конструктивно-производственные, обусловленные недостатками, допущенными в процессе — проектирования, а также несовершенством технологического процесса. В принципе в процессе эксплуатации за изменением параметров, характеризующих качество конструирования и ‘производства деталей сложного комплекса оборудования, можно наблюдать (рассматривая их как составляющие вектора Xt), нс практически это невозможно из-за увеличения затрат на эксплуатацию комплексов (для контроля таких параметров и управления ими пришлось бы изыскать, в процессе эксплуатации комплекса технические средства для проведения химического, спектрального, фотографического и другого анализа каждой детали)- Поэтому будем предполагать, что векторный случайный процесс at (а значит,. и Xt) зависит от некоторого внутреннего (не наблюдаемого в процессе эксплуатации) параметра а (в общем случае векторного), характеризующего конструктивно-производственное совершенство комплекса. Будем считать, что а может быть действительным числом, последовательностью, функцией, функционалом и; т. д. Естественно — полагать, что для заданного а (установившийся процесс производства деталей и комплексов) процесс at имеет известное вероятностное распределение Ра (в общем случае это многомерная функция распределения).
По мере накопления опыта эксплуатации комплекса (по мере роста /) можно лучше оценить параметр а (более квалифицированно судить о конструктивно iipiiii шпдетвеиных недостатках комплекса). Это позволит вносить коррективы и пьігпірііемую стратегию управления (будем учитывать доработки комплекса
іі|н-ді’і;іпитєлями промышленности и связанные с ними затраты). Таким обра — шм, щж горный процесс Xt окажется «шире» охваченным управлением. В этом и оудст заключаться смысл вводимого понятия адаптивного управления техниче — < ким состоянием комплекса.
Математически тот факт, что а остается до конца для нас неизвестным (его можно оценить только статистически), будем представлять следующим образом:
111 к — ^положим, что а имеет априорное распределение п. Тогда задача сведется к пі исканию такой стратегии управления, при котором достигается минимум |83] W) / J- J Y-, (X, Оді) Ра (dec) п (dot). В этом случае (когда а — неизвестный
а о.
іі.’ір. імі’тр) возможен и другой подход: применение минимаксного критерия для выбора такой управляющей стратегии обеспечивает min sup J Yi(X, ОдО Pa (da).
a a
При решении поставленных выше задач возникают большие трудности. Дей — с| ніпельно, в общем случае нельзя выбирать отдельно значения Ct, минимизирующие значения Mty(Xt), t— I, 2 N, так как выбор Ct влияет на посдедую-
IIIне члены Мф (Ха), s>t. Таким образом, здесь имеет место своеобразное после — III истине. Поясним это на простом примере.’Допустим, что а —действительные •пи. сі (время между отказами комплекса из-за конструктивно-производственных дефектов). Допустим, что эти дефекты приводят к скачкообразному изменению ішічспнй процесса Xt (внезапные отказы), тогда параметр а формально явля — сі си функцией от Xt. Кроме того, появление отказов, обусловленных конструктиво-производственными дефектами, зависит и от параметров управления С( (мри управлении могут заменяться детали с конструктивно-производственными дефектами). Поэтому, используя наблюдения Xi, х2,…, xt_i и принятые по этим наблюдениям решения Сі, С2,…, C(_i, можно оценить неизвестный параметр а:
== ct/ (-^1» х21 — ■ *» xt—і» С, С2» • •. * Ct—j).
Далее на основании этой оценки, можно выбрать такое управление С(, котимо минимизирует значение ф(А’і), где интеграл Ма (для учета скачков нужно использовать 6-функции) должен быть оценен при условии, что а—а*. I нк как точное значение и остается неизвестным, процедура. в принципе не приводит к оптимальному управлению, но получаемое управление практически доліпім быть близким к оптимальному. Однако это утверждение требует экспериментальной проверки1. При точно известном значении а управление было бы мпшмальным в смысле наиболее эффектной борьбы (путем замен) с конструк — I нвно-производственными дефектами детален комплекса.
Отмеченное выше последействие в выборе управляющей стратегии в ряде частных случаев может быть снято. Например, можно показать, что линейно — юі. ідратическая форма может быть с успехом использована для марковского процесса at. В этих моделях динамическое (и линейное) программирование приводит к приемлемым для практики решениям.
Сравнительно простыми оказываются, в частности, и решения задач, когда допускается почленная минимизация общих затрат.
Общий случай управления. Используя стратегию управления (1.1), запишем следующее:
S(20 = 5(хгь х2…., xt)= {ai, а2,… at | *1) =
= D {at, t, Ct(xb x2l…, є A x A X—X A = A‘.
t раз
При изменении вектора Х=(хи х%…, xt) по Xі имеем семейство (Ч(Х)|Лд=Х‘>.
1 В данном рассмотрении задача имеет смысл, если среднему времени меж — IV отказами по причинам конструктивно-производственного характера соответствует определенный уровень технологического процесса производства деталей комплекса.
Для некоторого пространства £, принадлежащего о-алгебре, используемой для вектора X, аналогично получаем преобразование S(E). Тогда мы имеем дело с а-алгеброй пространства А‘. Обозначим а-алгебру через 2(Gt), чтобы показать зависимость ее от выбранной стратегии управления Gt. Действительно, процесс at зависит от стратегии Gt (он подвергается регулировкам), а если процесс at неизвестен (например, это параметры изменения внутренней структуры деталей комплекса, не контролируемые в процессе эксплуатации), то можно говорить о зависимости а-алгебры 2(а<) от управляющей стратегии Gt (зависимость областей возможных изменений параметров, характеризующих структуру деталей, от стратегии Gt).
Если же для t= 1, 2, 3,…, а-алгебра 2 (ст*) =2t не зависит от управляющей стратегии Gt, то стохастическая составляющая at является преобразованным модулем Например, регулировками (без замены деталей) нельзя изменить внутреннюю структуру деталей комплекса. Это можно объяснить и так. Если известно, что процесс X(t) принимает значения х,, хг,…, Xt, то это значит, что а= (оь аг,…, at) содержится в S(X). Незнание вектора at может быть скомпенсировано тем, что известна область изменения этого вектора, т. е. 0-алгебры X(Gt).
Для преобразованной составляющей at (имеющей преобразованный модуль 2г), имеется некоторое семейство преобразованных значений S(X), не зависящих от выбираемых стратегий управления. Такой подход упрощает решение задачи о выборе оптимальной стратегии управления. В работе [83J доказана следующая теорема. Пусть Xt=D(at, t, Ct) есть управляемый процесс, случайная составляющая которого at является преобразованным модулем 2Ь и пусть для каждого имеется С=С(5), такое, что
M№t{D{at, t, С (S))) |2,_d = min М [<W{O(0,, t. C)} | = °< (s)-
Тогда существует управляющая стратегия G^J1*, минимизирующая
N
М ‘h {Xt)- Существование этой стратегии вытекает из того факта, что управ-
t=і
ляющие функции C(S) для <=1, 2,…, N рассматриваются в классе допустимых (физически имеющих смысл) стратегий. Возьмем в этом классе произвольную управляющую стратегию GK. Можно записать Мфі (Xt) через последовательно вычисляемый интеграл AUp,(Xt)~MI(X), где 1(Х) — условное его значение при известном вероятностном распределении at и заданных величинах X—Xi, х2, . .., Xt_i. Но знание этих величин наряду со знанием используемой управляющей стратегии эквивалентно тому, что a^S(X).
Для завершения доказательства теоремы запишем неравенство
/{X)=M[^t{D(at, t, C,)J|fleS(*)] >M[^t{D(at, t, C(S))}|2,_,] > «?(S).«
N N
Следовательно, Mfyt (Xt) > Mrf(S) и MY = ^ Mtyt (Xt) > ^ Ma2f (S).
l <=1
Последнее выражение, соответствующее оптимальной управляющей стратегии G% и завершает доказательство теоремы.
Пусть имеется скалярный процесс xt=D(at, t, Ct) =at+nt+Ct, где наблюдаемый процесс at = a, а «шум» п, задается таким образом:
щ (гауссовский процесс); Мщ = 0; Мщ, nt,
а априорное распределение для случайной величины а имеет вид: ct (гауссово распределение); Ма = 0; Ма.2 = аа%.
Ниже будем использовать квадратичную функцию стоимости фt(xt)=xt2.
Для функции S(x)
S(x)={ai………… at I a! + C1 = xu a2 + Сг = *2………………… at + Ct = xt).
Здесь содержатся точки а с координатами at=xt— Сі, аг—х2—С2,…,
=xt — Ct.
В этом случае с-алгебра 2(Gf) = 2( не зависит от управляющей стратегии G(t). Следовательно, щ есть преобразованный модуль 2(.
Для нахождения C(S) нужно решить уравнение
М {£>2 (at, t. С) I 2<_х) = min
или М {(я* + С)2(вх, at—1} =min. (1.3)
Другими словами, управление С нужно выбрать равным отрицательному значению величины at при условии, что известны предыдущие значения at, 02, • •., at—1.
В работе [83] показано, что в этом случае, согласно (1.3), можно получить С = (t — 1 + г)~і (ах + а2 + — + в/—х)=
= (t — 1 + /-)—1 (Jtrx-— Сх + х2 — C-i 4- … Ч- ле/_х —Ct-i),
где г=ал2/аа2 характеризует уровень динамического шу, ма.
В данном случае оптимальная стратегия управления
______ XI __ *2 _ Xt_i
l~ 1 + г 2 + г " ■ t— + r’
т. е. на величину Gf в момент t нужно осуществить снос процесса х<.
![]() |
![]() |
![]() |
Если уровень шума низкий, то эта стратегия может быть аппроксимирована следующим образом:
Функция стоимости, определяемая в момент t, находится в соответствии со стратегией управления (1.4):
Мх
которая уменьшается быстрее ап2 при t-*-00. Следовательно, значение параметра а может быть оценено самостоятельно. Если а неизвестно, то следует вы — брать С[——а, что приводит к средней стоимости xt2=an2. Этот простой результат является следствием ограничений, наложенных на «шум» щ и случайный параметр а (предположения гауссовостн), и предположения о квадратичной функции стоимости. Далее будет показано, что ограничения относительно Hi. а и функции стоимости в ряде случаев не являются критическими. Можно проанализировать разобранный пример и с позиции минимаксного критерия.
Рассмотрим скалярный процесс хt = D (at, t, Ct) = at + С/.
Случайная составляющая здесь вновь является преобразованным модулем ii-ii же о-алгебры. Найдем для величины С такой управляющий параметр, что — иы M{(at+C)z|ai, a2,…, a(_i}=min. В этом случае C=C(S)—C(x 1, х2,…, xt_t) «пи регрессия at по случайным переменным at, a2,…, at-t. Если допустимая і і ратегия управления является линейной, то управление должно давать наилуч — iiiiiii линейный прогноз для случайной составляющей at. В данном случае зада — |.| управления сводится к задаче прогноза (или к задаче регрессии).
Видоизменим задачу следующим образом. Пусть
Xf—D (at, t, С і) = a + nt + Ct
(no многих задачах эксплуатации «шум» rit можно трактовать как ошибки измерения параметров). Считаем, что а есть случайная величина, не подвержен — ити прямому наблюдению и принимающая значения из ‘натурального ряда чисел. Пусть а имеет следующее (геометрическое) распределение:
P{a = v) =9v_1p; v = 1, 2,…; q~— p
ні средним Ма=р~*.
Для динамического шума rit имеем нормальное (гауссово) распределение: Ря = Лг(0,о) для t< а и Ра = N (1,о) для t > а.
Это означает, что процесс Xt управляется при /= 1, 2,…, а—1 и не управляется при t— а. Будем предполагать, что ги независим для разлітчньїх t (при заданном а).
![]() |
![]() |
![]() |
Запишем частотную функцию для процесса ас
Щ+ S(а* -,)2]+ (тЫ‘ 2 pqa 1 ехр {~ S 4 =
v=1 v=a a=t+1 м= 1
![]() |
+qtp lexp{-~i"S4
V=1
У (#/ I &* • • ■ > l) — — , ч — iAow
/(fli, a2,…, a/_i) |/2Я’
* t
2 9"_iexp{“i}H“22a’+^a+l]+9</7_lexp{_^
^tqa 1ехр{-4г[-22^ + ‘_аї)+9< lp 1
a—1 v=a
В этом случае регрессия at относительно а і, a2,..щ_ есть
oo
M [at (ai, a2> • ■•» a>t—1] = J af (Pt («1» ^2» • • • > a/-i)) —
/-1
g= 1___________________________ v __________________________________
Оптимальная управляющая стратегия Ct равна введенной выше функции от ai, а2,…, at_, взятой с обратным знаком.
Рассмотрим еще ряд вариантов для разобранного примера. Пусть a — ортогональная 0, nt матрица размера пХп для стационарного случайного процесса (векторного процесса с п составляющими) и С — пространство из пХп ортого-
нальных матриц. Тогда Xt — Ct + at, <= 1, 2,…, М Ясно, что at здесь является преобразованной, как и везде выше. Введем функцию стоимости ф(л:) = (х(1))2, х = (*(4, х") є
На основании теоремы из [83] необходимо определить условное распределение fl(, если известны Cl, 02 С(_
Обозначим ковариационную матрицу этого распределения через
^ («ь Я2………. c<-i) = {т ij (ai, о2.- • ■. і, j= 1, 2,., и}.
Предположим, что эта матрица существует. Тогда выбираем
Сt = С = {Cij; і, j = 1, 2,…, п) такими, чтобы п
Мф(х) = М (x<1))2= V CuCiJrij(al, ………….. …… c<-l)
П
сделать минимальным. Ясно, что У С|= 1, так как С должна быть ортонор-
/-1
мальнон матрицей. Решение поставленной задачи сводится к отысканию наименьшего собственного значения (характеристического числа) матрицы «(tii, £*2.—., С|_,) Следовательно, оптимальная стратегия управления получается таким образом: Ct есть собственный вектор с наименьшим собственным шачением (характеристическим числом) матрицы R(а/, а2,…, at_і).
Исследование различных функций затрат. Выше рассматривалась квадрантная по х функция t|)(x). Для исследования более широкого класса функций ф (л) воспользуемся теоремой, доказанной Ю. Гренандером [83]. Пусть F есть t|ivыкция распределения на действительной оси и ф>(х)— функция с такими тремя свойствами: ф(х)з»0; ф(х) =0, если х = 0; ф(х)—непрерывная, неубывающая но модулю (х) (функция со значениями ф(—ос) = ч|)(+ ос) = + оо; ф(х)—выпуклая функция.
Iona в задаче нахождения
/(«)= J ф (х — ri)F(dx) = min (1.5)
лудіт единственное решение По или интервальное решение (пі, п2): минимум (I Г») достигается на этом интервале и вне его функция F не обладает свойствами функции распределения.
Обозначим величину п, доставляющую минимум 1(п), через фг, где z— случайная величина с функцией распределения F.
X
!фля непрерывного случая ф (х) = ( А (у) dy, где /4(у)>0 для у>0, А(у)<
0
11 1 (У) —неубывающая функция.
.'(ля отыскания оптимального п запишем уравнение
со с» X—п
I (п) = J ф (x — ri)F (dx) = J А (у) dyF (dx) =
•— со —- °о о
оо О
= j A(y)[—F(y+n)dy— j A{y)F (у + n)dy.
y=0 !/ = —“
n" 0
‘.In l (n") — I (n’) = J К (v) dv, если положить К (v) = J A{y — )F(dy).
h’ У—«о
Фнкипя K(v), как следует из предыдущей теоремы, является неубывающей, (нрицагсльной при больших отрицательных v и положительной при больших пм. чпжнтельных V. Минимум /(v) достигается в точке или точках, в которых Л( ( проходит через нуль.
|
![]() |
|
|
|
|
|
бы иметь возможность пронумеровать все правила данного подкласса) содержит оптимальное правило.
В отличие от введенных пыше вероятностей переходов дц, соответствующих любому правилу замен, обозначим через pij вероятности переходов, связанные с применением следующего правила замен: замена системы происходит только при. отказе. На практике обычно вероятности {рц} точно не известны, поэтому очень важно, чтобы искомое оптимальное правило было некритично к точным — значениям {ри}. Ниже будут приведены условия, накладываемые на переходные вероятности {pij}, при которых оптимальное правило замен имеет следующее содержание: замена должна осуществляться всякий раз, когда наблюдаемое состояние системы является одним из состояний £, £+1,-.., L для некоторого £. Для удобства дальнейшего изложения материала назовем это правило правилом типа «а».
Перейдем к строгой математической формулировке задачи.
Пусть переходные вероятности в марковской цепи с — состояниями — О, 1, …. L — {Ра} в дополнение :< обычным условиям [36) удовлетворяют следующим условиям: Pjo = 0 для /<Х, p^l >0 для некоторого при каждом
j<L, где — вероятность перехода через t шагов из состояния / в состояние L.
Можно представить себе некоторую измененную цепь Маркова, если для одного или нескольких значений / (0</</.), но не для всех j будем иметь во введенных обозначениях рщ— 1. Для измененной цепи Маркова это означает, что замена системы происходит тогда, когда система в момент наблюдения находится в состоянии j. Таким образом, имегм 2i_1—1 возможных измеиеииіі (количество новых цепей Маркова). Каждое такое изменение цепи соответствует возможному правилу замены системы. Пусть С обозначает класс таких правил и пусть <7/у[1] для каждого правила R в классе С обозначают стационарны! значения переходных вероятностей. Рассмотрим следующие функции потерь:
g (]) = 0, если gjо = 0, j < L
ёЦ)—Тп. п, если qjо=1, j < Ц
g U) = Т’а. п, если j = L.
Таким образом, функция g(j) обозначает потери времени на замены слете мы к моменту времени £, когда состояние системы равно / (цепь Маркова иахо дится в состоянии /).
Из теории цепей Маркова [49] известно, что
г L
t=l /=0
с вероятностью единица, где вероятности я3- удовлетворяют уравнениям L L
я/=2я^дЬ’=°. і……………………… L), 2я/=1
1=0 j-о
и неравенствам (/=0, 1, …, L).
Предел Yя является средними потерями времени иа обслуживание (заме ны) системы, отнесенными к единице времени «жизни» системы. Критерием Y, и будем пользоваться при оценке эффективности правила замен R.
•Если вероятности pij имеют вид p, j=0 для |/—г|>1, т. е. если переход і марковской цепи возможен только в соседнее состояние, то, очевидно, что ОПТИ мальное правило будет правилом типа «а»: <7зО=0, j <L—2 и <7ь_і, о=1 или ( в зависимости от величин Гп. п, Та. п и рц.
Однако в случае, когда состояния в системе могут совершать скачки (воз можен переход в цепи за один шаг в любое состояние), оптимальное правил замен не является тривиальным. Для отыскания этого правила применяются м«
годы динамического и линейного программирования. Предположим, что Р{Х= =*} = 1, т. е. в момент £=0 система находится в состоянии і с вероятностью единица.
Рассмотрим функцию
О < а < 1
для любого правила R в классе С. В работе [70] установлено, что Пга(1 — а) К/? (I, а)=ГЛ.
Коэффициент а здесь рассматривается по аналогии с теорией инвентаризации (теорией управления запасами) как коэффициент скидки (или коэффициент святи). Ниже критерий min YK(i, а) будет использоваться как основной критерий оптимизации.
Пусть правило Ra в классе правил С является таким, что для всех — і
Y(i, a)=Y *(г, сс) = min Ед (7, а),
Ra РЄС
г. е. по критерию min Ек(7, а) правило R’a является оптимальным правилом — гамены системы. Тогда с помощью стандартных в теории динамического программирования рассуждений можно показать, что Y(i, а) удовлетворяет следующим функциональным уравнениям:
! |
L L,
а 2 puy а)> г»-п +«2 р°іг и> а)
і-0 7-о
L
Y (L, Й)= 7’а. п + « 2 P0tY 7=О
іде связь между уравнением (1.7) и оптимальным правилом R* очевидна.
Рассмотрев оптимальные решения на каждом шаге, перепишем введенные — иышс функциональные уравнения следующим образом:
) (і, a, N)= min fa %pijY[(/, a, N— I), TB-„ + a 2 PojY U, a, TV — I)L
( /=o /=o J
L
если І Ф L; Y (*, a, 7V) = Га. п + a 2 PoJY U> “• *)»
7-0
гімні і — L при этом очевидно, что К (г, а, 0) = 0, если і Д L; Y (і, а, 0) = если і = L.
Тля Л/» 1 можно показать [10], что
Пш Y (7, a, N)—Y(i, а), 7 = 0, I,…, L.
N-* оо І
![]() |
|
|
|
![]() |
|
![]() |
Пусть имеется управляемая стохастическая динамическая система, наблюдаемая в моменты /=0, 1,… В каждый момент наблюдается одно из L+1 возможных состояний 0, После каждого наблюдения система «управляется»
с помощью реализации одного из К решений d………… dK, которые влияют на из
менения состояний системы( после осуществления решений).
Пусть Х0, Xi,… обозначают последовательность наблюдаемых состояний, а* V Ді, … — последовательность решений. Класс С состоит из функций
Dk(Xо. Ао>—> ХІ) = Р {Д/ = dk | Xq, Д0,…, Xt}
при k = 1,…, К‘, t = 0, I, Для каждого Х0, Д0,…, Xt (<= 0, 1..),
Du (Л’о. До.• • • * Xt) >0, k = I……………. К
к
и До,…, Xt)= 1.
k і
Будем далее полагать, что
К
Р {^т+1 = j I -^о» До,—, Xt—i} — ij (k) Dk (X0, Д0………………………….. Xt — i)
k-1
.uni /, 7=0,…, Д; <=0,1,…, где l|9/(fy)|| являются, такими, что q ij (k) > ", (/,/=-0,…, і; 1,…, /С)
L
и 2««(*)= і (,=0………………….. Ю-
1=О
Таким образом іі<?іі(*)іі — стохастические матрицы для каждого k.
Пусть С будет классом решающих процедур R таких, что
Dk (Д’о* До, ■ — — > Xt = 0 = Dikij — — 0…………… Ц к = •………….. <0
иг іпішсят от К0, Ло,…, К(_|, Л/_і и <.
[■ели RsC’, то последовательность {Kf}, <=0, 1,… является цепью Маркова
k, п. щпонарными вероятностями переходов {рц}-
К
PH = 2 Яti (*) Рік (П J = 0,…, L).
1
Пусть далее С" будет подклассом С’, таким, что £),* = 0 или 1. Следова — Н II. IHI, С" содержит только конечное число процедур.
Придадим использованному ранее критерию оптимизации стоимостный смысл..
l, и м считать, что каждой последовательности состояний системы и последопа — II II. ПОПП принимаемых решений соответствуют некоторые средние СТОИМОСТИ luip. im, в частности и рассмотренные уже затраты на обслуживание систем) ні, гіП 0, г=0,…. L; k=l,…,K t=0, 1 …, зависящие от момента t (система II, in. in, ч.-іется в момент t в состоянии і, и в момент I принимается решение dh). іМіі. ікіі далее будем предполагать, что ыи, (t) = оць, т. е. исключим зависимость. , 11 ill миг П1 IDift от времени.
Инсдем еще одно обозначение: Wt, t — 0, I,… — среднюю стоимость, отнесен — и и, і, моменту t, которая ставится в соответствие решающей процедуре R. Рас — I мііірнм две задачи.
Ііііііічи 1. Предположим, что Х0=і с вероятностью единица. Необходимо, nllpr нмнть такую процедуру /?!, при которой
г
Q»? minO^’ (г = 0,…, L), где = lira sup Wt —
/?£С T ->-оо 1
рі-дмин стоимость, отнесенная к единице времени.
Задача 2. Предположим, что ХоФі с вероятностью сліпішім, и / ин’ііннті поглощающим состоянием для всех У? єС и ои, =0, /е = I, …. К І |»чґі> > шчи
![]() |
![]() |
![]() |
определить такую процедуру Rz, при которой
Другими словами, Sjy* есть общая средняя стоимость, спотисп’їиуитіни in менению состояний системы от і до L при использовании рСІІІПічШГЙ процедуры R. Решение задачи 1 содержится в работах [64, 88], задача 2 неііісші и рнГиис [89]. Для решения обеих задач воспользуемся работой Манна |нн|.
Покажем, что процедуры Ri и следует искать внутри клиссн (следи — вательно, и внутри С’), а задачи 1 и 2 можно свести к задачам ліііігПшіін про граммирования.
В работах [72, 80] показано, что при поиске процедур Rі н процедури
С—С’ могут быть отброшены.
Воспользуемся следующей теоремой, доказанной Дерманом [77|
Теорема 3. В классе С" существуют процедуры Rt и Rz такне, чіп (для задачи 1)
Q{fit = rainQ^1 (i = 0,…t L)
и для задачи 2
Сформулируем теперь задачи 1 и 2 как задачи линейного программирования.
Напомним основное предположение: для всех рассматриваемых процедур последовательность состояний {Х(}, /=0, 1,… образует цепь Маркова со стационарными вероятностями переходов {Pij}. Число состояний исследуемой цепи конечно, все состояния принадлежат некоторому классу I. Пусть далее /(/), /є/
■ есть функция, определенная на всех состояниях, a pa{t)—условная вероятность ТОГО, ЧТО Xt =j При условии, ЧТО Xi_ ( = 1 И A’f;ф І для всех О<S<(, где, по определению />,Д0) =0 для всех і и /. Тогда, как известно в теории цепей Маркова [49],
г
Пт — V. М|/(Д,)| V я,/ (у) (1.8)
1 ‘ >w-4 АшЛ
/II JU
■ и
2 2 PU (0 / (Л =22 Рч (0 / (/) = я — I V л у / (у), (1.9)
1=0 ус/ уе/с 0 д /
где все {jtj} удовлетворяют неравенствам:
Я/ > 0, я/—2я’РЛ/ = 0. /Є/, 2 я/ = *• (МО)
ІЄ/ УС/
Для использования результатов (1.8—1.10) сделаем дна предположении.
Предположение а: в задаче 1 для каждого Rs. C’ состояния 0,…. / нрщнітдгжнт некоторому классу. Предположение (3: в задаче 2 для каждого R• ( юііоянпс L достигается из состояний 0,…, L—1 путем конечного числа переходив і нероит — ностью единица.
Теорема 4. Если предположения и(р) верны, то індичії I и 2 Мшуі (иль сформулированы как задачи линейного программировании |77|
Рассмотрим еще одну оптимальную процедуру, для чічи ши н’М ионий критерий оптимизации. Предположим, что ш, й > 0 и “(А > О (( Ч…………………………………………………………………………………………………………….. I. I,.
К) есть значения введенных НЫШС Средних СІІІІІМІИ ІИІ І 16м ІІІ. ІЧІІМ
■через Wt’ И W", /=0, 1 … соответствующие 01 НОСИ 1РЛЫ1МО • lie ‘I Hill I 11 ill МИСТИ для фиксированной процедуры R.
Рассмотрим критерий стоимости:
т і т
Ф#) = lira sup 2 Wt / 2iri(« = 0,…, L)
r-|-“ <=0 / f=0
при X0~i с вероятностью единица.
Если R^C’ и верно предположение а, то
L К ILK
Ф^ = 2 2 I 2 2 ^‘DikVik (* = 0,…, £),
i=Oft=l I і=0/?-=1
где Лц £=0…….. L, удовлетворяют (1.10). Следовательно, фи(0 можно минимизи
ровать по R^C’.
Таким образом, получаем интересный результат, который сформулируем в виде теоремы.
При предположении а существует процедура /?3єС" такая*
Доказательство этой теоремы также имеется в работе [77]. Рассмотрим, опираясь иа работу Клейна [86], практическое применение описанных подходов к задачам эксплуатации сложных технических систем.
Будем считать, что имеем дело со «стареющей» системой (система в конечном итоге попадает в «поглощающее» состояние L), процесс «старения» который будем вновь представлять цепью Маркова. В качестве критерия по-прежнему используем средние потери (среднюю стоимость) в единицу времени.
Итак считаем, что процесс «старения» системы является случайным, состояния системы известны только в моменты контроля. После контроля возможны две альтернативы: а) заменить систему и б) сохранить ее в зксплуатаціш. При альтернативе «б» возможны, в свою очередь, два решения: осуществить, если необходимо, немедленный ремонт и отложить принятие решения до следующего момента контроля.
Будем, как и ранее, предполагать, что «старение» системы может быть описано в дискретные моменты времени конечной цепью Маркова и что с помощью процедуры контроля можно определить, в каком состоянии находится система в моменты контроля. Вторым очень важным предположением будет предположение о том, что ремонты могут привести систему в одно из многих возможных состояний (а не только в состояние, соответствующее новой системе).
Покажем, что для выбранного ранее критерия задача нахождения оптимальной политики (стратегии) контроля, ремонта или замены системы также может быть сформулирована в терминах линейного программирования. Первой работой, дающей формальное математическое обоснование применения метода линейного программирования к управляемым цепям Маркова (по критерию средней стоимости в единицу времени), была работа Манна [88].
Главное отличие излагаемой ниже задачи от задачи Манна заключается в том, что времена между переходами в цепи зависят от решающей процедуры, а не являются фиксированными величинами, как предполагал Манн.
Будем по-прежиему обозначать состояния системы в любой момент времени t как О, 1,…. L, где 0—начальное, a L — конечное (отказовое) состояние системы. Состояния 1, 2,… L—1 возникают случайно. Предположим, что система начинает эксплуатироваться, находясь в новом, нулевом состоянии, а в процессе эксплуатации обязательно попадает в конечное состояние L и остается в нем («стареющая» система), т. е. изучаемый случайный процесс не может распространяться влево. Это накладывает следующие ограничения иа процесс (рассматриваем для состояний системы до замены или ремонта дискретную цепь Маркова со стационарными вероятностями переходов qij, і, /=0, її, …, L):
Iim q-L (t) =t 1 (/ = 0, 1,…* L— 1); q LL — 1*
t —►со
где qa(t) есть вероятность перехода за t шагов от состояния і в состояние /» /=1, 2 Кроме того, предположим* что <?iz,>0, £=0, 1,…, L—1.
Пусть ds’k(i) обозначает решение изменить состояние системы от НйЧМльної и «состояния і до состояния s и запланировать следующую проверку черга А їм pin дов от момента изменения начального состояния.
Таким образом, можно записать для диапазона состояний системы
і = 0, 1L, Г (I)______________ L{K— 0; k=…………… К
S є S,; Si = {0, 1________ L — 1} u {*’}-
Здесь L(m) означает, что система не будет работать в течение т і’диннц времени. Следует отметить, что номер состояния L(,m) может расти, івк іоіь і m тема может отказать после проверки и остаться в состоянии откати дії г.’іюіум щей проверки. Предполагаем, что самый большой период времени, н ігЧгііін мі торого система может оставаться неработающей, можно задать. Оби кінчим пн через k—І,. Это. говорит о том, что наибольший интервал между пронгрнпмн иг
темы есть k=K (если <?sb=0, ss{0, 1……………. L—1}, то наибольший донупнмый им
тервал проверок становится функцией от s и количество переходом от сиг IПИНИИ s до состояния L может быть минимальным). Отсюда следует: если I (/).
j=0, 1,…. К—I, где s—i, и система не подвергается никаким проі|шлнкітічгскіім действиям, то k должно удовлетворять неравенству j+k<C. K.
Введенное нами обозначение 5, потребовалось для представлення фи иі’іегмі возможных решений: произвести ремонт, осуществить замену или ничего не де дать с системой. Предполагается, что проверки, ремонты и замены системы производятся мгновенно.
Таким образом, класс всех возможных рандомизированных решающих процедур (правил) имеет вид:
Д|,г*=р{^)- где 20/s5 = 1 (| = 0- 1—. К*-‘))-
s:k
Из сказанного ясно, что сумма по всем видам индексов {.s : k} ограничена теми величинами s, которые принадлежат классу S,-. Следовательно, все наши решающие процедуры являются такими, что принятие решения в момент каждой проверки зависит только от наблюдаемого состояния. Ранее было показано, что этого достаточно для рассмотрения правил введенного здесь класса. Пусть изменения состояний «старейшей» системы с учетом реализации решающего правила образуют новую эргодичсскую (управляемую) цепь Маркова со стационарными вероятностями переходов рц, і, / 0, I ЦК I), имеющими следующий вид:
i, 7=0, I,…, £(к-і);
[Qsj{k ]= 0, I____ L-s= 0, 1,…, L — I; /? = I, 2,…, K
dsL[k— n), s — 0, I, L— I; j = L (/z), n= 1, 2,…, К — П
(Ъ — n) > 0;
I, s = L (m), m = 0, 1………….. К — 2; j = L (n), n= 1, 2,.. •
.. ,K — I> k—n— m > 0, j= s + k, k = l, 2,…, L(K — l) —s« 0 в остальных случаях.
Следует еще раз отметить разницу между переходными вероятностями Цц, і, у=0, 1,…. L и рц, і, /=0, 1,L(K—1). Дело в том, что переходы н унрин. ія емой цепи (переходные вероятности рц) имеют место при каждой нрофнлак і нм — (замена, ремонт), в то время как переходы в неуправляемой цени (принт м рения» с вероятностями переходов Ці,) происходят независимо от ННСІНІНТіІ яме шательства (такого вмешательства просто нет по определении) нрпнптп «п іре ния») и наблюдаются в моменты контроля.
При управлении «стареющими» системами будем иметь дело ш слііуіоіннчи видами стоимости. Во-первых, со стоимостью профилакінкн, г, и іншмпі м. іо pc монта или замены, которая зависит от состояния системы до н ипгле нрофнык-
тики. Например, ремонт (замена) с возвращением системы в исходное состояние обычно существенно зависит от того, отказала перед этим система или нет. Ремонт (замену) иногда экономически выгоднее проводить до отказа. Другой вид стоимости—стоимость, связанная с проверками системы. Она определяется количеством проверок и зависит от условий работы системы при проверке, когда определение, одних состояний системы может оказаться более трудным, чем других. Кроме того, при определении — состояний системы могут использоваться различные процедуры проверки, которые зависят от времени, прошедшего с момента предыдущей проверки, и от того, какая профилактика проводилась (или не проводилась вообще) при предыдущей проверке. И введем, так называемую, штрафную стоимость, зависящую от промежутка времени между отказом системы и его обнаружением при проверке.
Стоимость проверки и штрафная стоимость далее будут обозначаться символом t s:k j■
Пусть С;s:k обозначает стоимость, связанную с принятием решения dsk;j(i). Эта стоимость состоит из стоимости профилактики mis, обусловленной решением изменить состояние системы ОТ І ДО S, где ГПго есть стоимость замены системы да отказа, если —1, и есть стоимости замены после отказа, если i>L—1, и тін—
стоимость ремонта, во время которого состояние системы изменяется от і ДО S, если 0<s-<L—її; кроме того, m, s — 0, если і—$фЬ(К—II).
Обозначим вновь среднюю стоимость в единицу времени через У. Этот критерий равен средней стоимости проверки (при проверках может быть осуществлен ремонт, замена), деленной на среднее время между проверками.
Средняя стоимость проверки С (используется эргодическая теорема для цепей Маркова)
* 10-225 +25
і sk j l s:k
где вероятности Я;, i=0, 1, …, L(K—vl) удовлетворяют уравнениям:
і— l{k— О; (і. ii)
I
(Іл2>
j
Если обозначить время между проверками через / (это случайная величина, так как решающие правила являются рандомизированными), то среднее время между проверками системы
A4I/]=2S*"’D/,:4
і s :k
при соблюдении условий (1.11) и (1.12).
I’ll 2 2 Яг^*:Л:*Д:А/ + 22 niDis:if is j) /22
і s:k j і s-.k j і s:k
Следуя идеям, излагаемым в работе Манна [88], положим
Хі, м=Пі°иї
Тогда (1.13) можно переписать в виде:
![]() |
![]() |
2 2
ГДЄ his* = ^tsMiVs:*j + Cls*
Так как Лу = 2 nlPiJ = ^ Я/ 2 Di. s:~kv,:kj —
і і s:k
= 22 = 2 — v.*>
то L+K условий (1.11) запишутся так:
2 Vj* 22 а, (у=о.1…………………. ^ (* -‘)).
/ sift
а условие (1.12) примет вид:
УУХ, т = 1 •
_J ^ js:k j s:k
Таким образом, задача заключается в том, чтобы отыскать последовательность {xis:k }, /=0, I,…. L(K—1), seSj, /(=1,…, К такую, чтобы минимизировать нелинейную функцию (I. M), подверженную L + K+ 1-му ограничению (1.15) и (1.16).
Сформулированную задачу можно решать методом линейного программирования так, как предложено в [77, 78]. Однако возможен и другой путь решения, который рекомендует Клейн [86]: в целях минимизации (1.14) последовательно применять метод линейного программирования для отыскания минимума числителя (при фиксированном знаменателе), подверженного ограничениям (1.15) и (1.16). Эта процедура должна повторяться для всех приемлемых значений знаменателя, после чего выбирается минимум из всех полученных путем минимизации значений числителя. Этот минимум соответствует оптимальным интервалам между проверками системы. Следует отметить, что знаменатель выражения (1.14) есть среднее время между проверками, поэтому под приемлемыми значениями знаменателя мы должны понимать такие времена (затем подлежащие осреднению) между проверками системы, которые физически осуществимы (с учетом накопленного опыта обслуживания аналогичных систем в эксплуатации).
Кратко остановимся еще на одной разновидности задач зксилуаізціш систем по состоянию, которая будет состоять в отыскании такой решающей процедуры, при которой максимизируется среднее время между заменами (регулировками) системы. Главное отличие ОТ изложенного выше. П|К.»Н)Ч;|1Н я II предположении, что ничего неизвестно о количественных значениях СИНІМО. І пі, которые рассматривались ранее. Предполагается только, что гшими. м. ымс — ны системы намного превосходит стоимость профилактики, я і шнм. н щ. . низанные с пребыванием системы в нерабочем состоянии, ннмшно Гниімік. юн — мости замены системы. При ограничении на неронзниті німіцім. и, кми задача сводится к задаче линейного программировании, рсШ1 ИШ’ м приш ито в работе [78].
В заключение отметим, что изложенные выше подходы к задачам эксплуатации сложных технических систем по состоянию развиваются далее в ■интересной работе П. Колезара (87], в (81] также содержатся некоторые обобщения рассмотренных выше задач.
Все рассмотренные выше модели технического обслуживания относятся к непрерывно работающей системе (если система работает с перерывами, то для использования любой из приведенных моделей необходимо сделать предположение о том, что в перерывах между использованием по назначению в системе отказов не происходит). Однако перерывы в работе и возможность появления (или обнаружения) отказов или неисправностей во время нахождения в неработающем состоянии присущи авиационным системам. Для учета этих особенностей при решении задач эксплуатации по состоянию следует переходить к моделям, в основе которых лежат полумарковские управляемые процессы. Полумарковский процесс (в отличие от марковской цепи первого порядка) задается не только матрицей переходов из состояния в состояние между соседними (одинаковыми) моментами времени, но и функциями распределений времени пребывания исследуемого процесса в каждом состоянии перехода. Оказывается, что все задачи управления в марковской постановке имеют обобщения (и решения) для полумарковского случая. Интересно отметить, что получаемый при этом характер оптимальной стратегии управления не меняется по сравнению с марковским случаем (стратегия остается однородной и марковской), но меняется величина упреждающего допуска.